Amélioration des méthodes de conduite de projets Big Data : retour d'expérience de pilotes industriels multi-sectoriels
نویسندگان
چکیده
RÉSUMÉ. Afin de mener à bien leurs activités, les entreprises sont de plus en plus confrontées au défi de traiter des quantités croissantes de données provenant de dépôts numériques, d’applications d’entreprise, de réseaux de capteurs... Bien qu’un large éventail de solutions techniques soit disponible pour traiter ces données massives (Big Data), beaucoup d’entreprises peinent à les déployer en raison d’un manque de maturité lié à leur gestion. Cet article propose une guidance en la matière. Il s’ancre dans des méthodes documentées dans la littérature, trouvant leurs racines dans les projets de fouille de données. Nous avons également mené une série de pilotes Big Data dans différents domaines (IT, médical, sciences de la vie, spatial) qui nous ont permis de dégager un retour d’expérience et un guide pratique pour la conduite d’un projet Big Data. Ceci permet d’exploiter au mieux les méthodologies disponibles afin de traiter les problématiques relatives à la collecte des exigences, l’exploration et la préparation des nouvelles données, le phasage itératif de l’implantation de la solution et une montée en maturité.
منابع مشابه
Faire vivre un référentiel métier dans l'industrie : le système de gestion de connaissances ICARE
Résumé. La gestion des connaissances, enjeu majeur pour l’industrie, est entrée dans une phase concrète de déploiement. La conjonction d’une maturité des organisations dans la maîtrise de leur métier, la consolidation de méthodes et les outils évolutifs pour faire vivre un patrimoine de connaissances favorisent l’émergence de projets significatifs et leur diffusion opérationnelle au sein de gra...
متن کاملSynthese des Controleurs Optimaux pour les Systemes a Evenements Discrets
Dans cet article, on introduit le problème de synthèse de contrôleurs optimaux des systèmes à événements discrets et nous proposons une procédure pour la résolution de ce problème, dans le cas où le procédé et les spécifications sont représentés par des automates à états finis et présentant une complexité croissante. Nous allons souscrire à la méthodologie de synthèse selon la théorie de la com...
متن کاملI-Semantec : une plateforme collaborative de capitalisation des connaissances métier en conception de produits industriels
La réutilisation des connaissances métier produites lors des projets antérieurs est une stratégie majeure pour améliorer les processus de conception. Actuellement, il est critique de mettre à la disposition des concepteurs les ressources documentaires et bases de données représentant ces connaissances. Les sources des connaissances métier auxquelles nous nous intéressons sont les Systèmes de Ge...
متن کاملAnalyse OLAP sur des tweets et des blogs : un retour d'expérience
Résumé. Le projet ANR IMAGIWEB dans lequel s’inscrit ce travail s’est donné pour mission d’étudier les images véhiculées sur Internet en se basant sur la détection d’opinions. Deux cas d’étude ont été définis : (1) le premier vise à répondre aux besoins d’analyse de chercheurs en science politique grâce à des données issues de Twitter durant la campagne présidentielle de 2012 ; (2) le second do...
متن کامل